统计

Bioestadística Aplicada Nivel Intermedio

Distribuciones
Muestrales

La media y la proporción como variables aleatorias · Teorema Central del Límite · Aplicaciones en inferencia estadística

5.1 Distribución de la media de la muestra — μ_X̄, σ_X̄, TCL, poblaciones normales

5.3 Distribución de la proporción de la muestra — P̂, μ_P̂, σ_P̂, normalidad para muestras grandes

Ref.: Shafer, G. & Zhang, Z. (2012). Introductory Statistics. Saylor Academy. Capítulo 6.

🎯

Diapositiva 02 · Objetivos

Al terminar esta clase podrás…

1

Explicar por qué la media muestral X̄ es una variable aleatoria con su propia distribución de probabilidad, media y desviación estándar.

2

Aplicar las fórmulas μ_X̄ = μ y σ_X̄ = σ/√n para calcular la media y desviación estándar de la distribución muestral.

3

Enunciar y aplicar el Teorema Central del Límite: para n ≥ 30, X̄ es aproximadamente normal, independientemente de la distribución poblacional.

4

Calcular probabilidades sobre X̄ utilizando la estandarización Z = (X̄ − μ_X̄) / σ_X̄ y la tabla normal.

5

Describir la distribución muestral de la proporción P̂, verificar la condición de normalidad y calcular probabilidades sobre proporciones.

📊

Diapositiva 03 · Sección 5.1 — Idea central

5.1 Distribución de la media de la muestra

⚖️ Idea central

La media muestral X̄ no es un número fijo: varía de muestra en muestra. Es una variable aleatoria con su propia distribución de probabilidad, media y desviación estándar. Comprender esta variabilidad es la base de toda inferencia estadística.

🔢 La media muestral como variable aleatoria

Notación

X̄ (mayúscula) = la media muestral como variable aleatoria
x̄ (minúscula) = los valores particulares que toma
Cada muestra de tamaño n produce un valor diferente de x̄

Propiedades

Como variable aleatoria, X̄ tiene:

Una media: μ_X̄
Una desviación estándar: σ_X̄
Una distribución de probabilidad

📐 Fórmulas fundamentales

Media de la distribución muestral

μ_X̄ = μ

La media de X̄ es igual a la media poblacional μ. La media muestral es un estimador insesgado de μ.

Desviación estándar de la distribución muestral (Error estándar)

σ_X̄ = σ / √n

Donde n = tamaño de muestra. A mayor n, menor variabilidad de X̄ alrededor de μ.

⚓

Diapositiva 04 · Sección 5.1 — Ejemplo resuelto

Ejemplo: equipo de remeros — distribución de X̄

Datos del problema

Cuatro remeros pesan 152, 156, 160 y 164 lbs. Se extraen todas las muestras con reemplazo de tamaño n = 2. Encuentra la distribución de probabilidad, media y desviación estándar de X̄.

📋 Distribución de probabilidad de X̄

x̄ (lbs)	P(X̄ = x̄)	Observación
152	1/16	Solo 1 forma posible
154	2/16
156	3/16
158	4/16	Valor más probable (centro)
160	3/16
162	2/16
164	1/16	Solo 1 forma posible

16 muestras equiprobables

Hay 4 × 4 = 16 muestras posibles con reemplazo. La distribución ya comienza a parecerse a una campana, aunque la población era uniforme.

🔢 Cálculo de μ_X̄ y σ_X̄

Media de la distribución de X̄

μ_X̄ = Σ x̄·P(x̄) = 158

Coincide exactamente con la media poblacional μ = 158.

Desviación estándar

σ_X̄ = √10 = σ/√n = √20/√2

Población: σ = √20. Con n = 2: σ_X̄ = √20/√2 = √10. ✓

Conclusiones clave

μ_X̄ = μ (insesgado)
σ_X̄ < σ (promedios varían menos que datos individuales)
La distribución ya tiene forma de campana aunque la población era uniforme

🏔️

Diapositiva 05 · Sección 5.1

Teorema Central del Límite

🏔️ Teorema Central del Límite (TCL)

Para muestras de tamaño n ≥ 30, la distribución muestral de X̄ es aproximadamente normal, con media μ_X̄ = μ y desviación estándar σ_X̄ = σ/√n, independientemente de la forma de la distribución poblacional. A mayor n, mejor la aproximación.

📈 Efecto del tamaño de muestra

Con n = 1: la distribución de X̄ = distribución de la población
Con n = 5, 10: la distribución se va acercando a la campana
Con n ≥ 30: X̄ es prácticamente normal en la mayoría de los casos
Cuanto mayor es n, más estrecha y centrada es la distribución de X̄

Caso especial — Población normal

Si la población ya es normal, entonces X̄ es exactamente normal para cualquier n, sin importar el tamaño de muestra.

🎯 Dos variables aleatorias distintas

1️⃣

X — Medición individual

Distribución de la población. Media = μ, desviación estándar = σ. Forma desconocida en general.

2️⃣

X̄ — Media muestral

Distribución muestral. Media = μ, desviación estándar = σ/√n. Aproximadamente normal para n ≥ 30 (TCL).

Importancia práctica

El TCL permite calcular probabilidades sobre X̄ aunque no conozcamos la distribución de la población.

🧮

Diapositiva 06 · Sección 5.1 — Ejemplo resuelto

Cálculo de probabilidades sobre X̄ — Ejemplos

Estandarización de X̄

Z = (X̄ − μ_X̄) / σ_X̄ = (X̄ − μ) / (σ/√n)

Una vez estandarizada, usar la tabla Z normal. Siempre usar σ_X̄, nunca σ directamente.

🚗 Ejemplo A — Impuestos vehiculares

Datos

μ = $13,525 · σ = $4,180 · n = 100
¿Cuáles son μ_X̄ y σ_X̄?

Solución

μ_X̄ = $13,525

σ_X̄ = 4,180 / √100 = $418

El error estándar es $418, mucho menor que la σ poblacional ($4,180).

🏎️ Ejemplo B — Vida útil de neumáticos

Datos

μ = 38,500 mi · σ = 2,500 mi · n = 5 · Población normal
P(X̄ < 36,000)?

Solución (en miles de millas)

σ_X̄ = 2.5/√5 = 1.118

Z = (36 − 38.5)/1.118 = −2.24

P(X̄ < 36) = P(Z < −2.24) = 0.0125

Solo 1.25% de muestras tienen media inferior a 36,000 mi. Nota: n = 5 pero la población es normal, por lo que aplica sin TCL.

📐

Diapositiva 07 · Sección 5.1 — Ejemplo paso a paso

Ejemplo completo — TCL con n = 50

Problema

X̄ es la media de una muestra aleatoria de tamaño n = 50 extraída de una población con μ = 112 y σ = 40.
a) Encuentra μ_X̄ y σ_X̄ · b) P(110 < X̄ < 114) · c) P(X̄ > 113)

a

Parámetros de X̄

μ_X̄ = 112 · σ_X̄ = 40/√50 = 5.657. Como n = 50 ≥ 30, se aplica el TCL.

b

P(110 < X̄ < 114)

Z₁ = (110−112)/5.657 = −0.35
Z₂ = (114−112)/5.657 = +0.35
P = 0.6368 − 0.3632 = 0.2736

c

P(X̄ > 113)

Z = (113−112)/5.657 = 0.18
P(Z > 0.18) = 1 − 0.5714 = 0.4286

💡 Reflexión importante

❓

¿Podemos calcular P(X > 113)?

Para un individuo (X), no podríamos calcular P(X > 113) porque no conocemos la distribución de la población, solo su media y σ.

Para la media muestral (X̄), sí podemos porque el TCL garantiza que X̄ es aproximadamente normal.

Regla de estandarización

Siempre estandarizar con σ_X̄ = σ/√n (no con σ) cuando se trabaja con X̄. Usar σ directamente sería el error más común.

🎲

Diapositiva 08 · Sección 5.3 — Idea central

5.3 Distribución de la proporción de la muestra

🎲 Idea central

La proporción muestral P̂ (P sombrero) también es una variable aleatoria que varía de muestra en muestra. Es el análogo de X̄ para variables categóricas: estima la proporción poblacional p.

📖 Definición y notación

Ejemplo numérico

Si en realidad el 43% de personas en una tienda compran algo:
→ p = 0.43 (proporción poblacional).

Si en una muestra de 200 personas, 78 compran:
→ p̂ = 78/200 = 0.39 (proporción muestral).

Conexión con X̄

Codifica: 1 si tiene la característica, 0 si no. Entonces p̂ = x̄ (media de los 0s y 1s). Por eso el TCL aplica también a P̂.

📐 Fórmulas de la distribución de P̂

Media de la distribución muestral de P̂

μ_P̂ = p

P̂ es estimador insesgado de p.

Desviación estándar (error estándar de la proporción)

σ_P̂ = √(pq/n)

Donde q = 1 − p. A mayor n, menor σ_P̂.

Distribución muestral (muestras grandes)

Para muestras grandes, P̂ es aproximadamente normal con media p y desviación estándar √(pq/n).

✅

Diapositiva 09 · Sección 5.3

Condición de muestra grande para P̂

Condición de normalidad

La distribución de P̂ es aproximadamente normal cuando el intervalo [p − 3σ_P̂, p + 3σ_P̂] se encuentra completamente dentro del intervalo [0, 1].

🔍 ¿Qué hacer cuando p es desconocida?

Verificación práctica

Si p no se conoce, sustituir con p̂ en la verificación:

Confirmar que el intervalo:
[ p̂ − 3√(p̂(1−p̂)/n) , p̂ + 3√(p̂(1−p̂)/n) ]

esté completamente dentro de [0, 1].

Nota sobre n = 30

La condición para P̂ es más exigente que simplemente n ≥ 30. Depende también del valor de p. Cuando p está cerca de 0 o de 1, se necesita un n mucho mayor.

📊 Estandarización de P̂

Estadístico Z para la proporción

Z = (P̂ − p) / √(pq/n)

Una vez verificada la normalidad, se usa la tabla Z normalmente.

Escenario	p	n	Normal?
p cerca del extremo	0.1	15	❌ Muestra pequeña
p cerca del extremo	0.1	100	✅ Aceptable
p central	0.5	15	✅ Aceptable

🗳️

Diapositiva 10 · Sección 5.3 — Ejemplo resuelto

Ejemplo completo — Proporción de votantes

Problema

El 38% de los votantes de una región apoya una propuesta. Se encuestan n = 900 votantes.
a) Verificar que P̂ es aproximadamente normal. b) P(|P̂ − 0.38| ≤ 0.05).

1

Calcular μ_P̂ y σ_P̂

p = 0.38 · q = 0.62 · n = 900
μ_P̂ = 0.38
σ_P̂ = √(0.38 × 0.62 / 900) = 0.01618

2

Verificar normalidad

3σ_P̂ = 3(0.01618) ≈ 0.05
Intervalo: [0.38 − 0.05, 0.38 + 0.05] = [0.33, 0.43]
✅ Completamente dentro de [0, 1].

3

Calcular probabilidad

P(0.33 < P̂ < 0.43)
Z₁ = (0.33 − 0.38)/0.01618 = −3.09
Z₂ = (0.43 − 0.38)/0.01618 = +3.09
P = 0.9990 − 0.0010 = 0.9980

💬 Interpretación

📊

P = 0.9980 → 99.8% de probabilidad

Con una muestra de 900 votantes, hay un 99.8% de probabilidad de que la proporción muestral esté dentro de los 5 puntos porcentuales de la proporción real (0.38).

Lección

Muestras grandes hacen que la proporción muestral sea muy precisa. Por eso las encuestas políticas con n ≥ 1,000 tienen márgenes de error pequeños.

Relación con P(Z < ±3.09)

Que el intervalo de verificación sea exactamente [p ± 3σ_P̂] no es coincidencia: significa que verificar la condición de normalidad equivale a preguntar si la probabilidad de estar dentro de ±3σ cae en [0,1].

⚖️

Diapositiva 11 · Síntesis

Comparativa: distribución de X̄ vs. P̂

Característica	Media muestral X̄	Proporción muestral P̂
¿Qué estima?	Media poblacional μ	Proporción poblacional p
Media de la distribución	μ_X̄ = μ	μ_P̂ = p
Error estándar	σ_X̄ = σ/√n	σ_P̂ = √(pq/n)
Condición de normalidad (TCL)	n ≥ 30 (o población normal)	[p − 3σ_P̂, p + 3σ_P̂] ⊂ [0,1]
Estandarización	Z = (X̄ − μ)/(σ/√n)	Z = (P̂ − p)/√(pq/n)
Tipo de variable	Cuantitativa continua	Categórica (éxito/fracaso)

Relación fundamental

La proporción muestral P̂ es matemáticamente idéntica a la media muestral X̄ cuando la variable es binaria (0/1). Por eso el TCL aplica igual a ambas, y las fórmulas tienen la misma lógica: la media de la distribución muestral = parámetro poblacional, y el error estándar decrece como 1/√n.

✏️

Diapositiva 12 · Práctica

Ejercicio de comprensión

P1

Una población tiene μ = 50 y σ = 10. Se extrae una muestra de n = 25. ¿Cuál es σ_X̄?

a 10
b ✓ 2 (σ/√n = 10/√25 = 2)
c 0.4

P2

¿Para qué valor mínimo de n garantiza el TCL que X̄ es aproximadamente normal, sin importar la distribución poblacional?

a n ≥ 10
b n ≥ 20
c ✓ n ≥ 30

P3

Una población normal tiene μ = 100 y σ = 15. Para n = 9, ¿es X̄ aproximadamente normal?

a No, porque n < 30
b ✓ Sí, porque la población es normal, X̄ es normal para cualquier n
c Solo si el muestreo es con reemplazo

P4

Si p = 0.6 y n = 100, ¿cuál es σ_P̂?

a ✓ √(0.6 × 0.4 / 100) = 0.049
b √(0.6/100) = 0.077
c 0.6/√100 = 0.06

P5

¿Qué sucede con σ_X̄ cuando el tamaño de muestra n se cuadruplica (de n a 4n)?

a Se divide entre 4
b ✓ Se divide entre 2 (σ/√(4n) = σ/(2√n) = σ_X̄/2)
c Permanece igual

P6

¿Cuál es la principal utilidad práctica del TCL en inferencia estadística?

a Nos dice la distribución exacta de la población
b ✓ Permite calcular probabilidades sobre X̄ aunque no conozcamos la distribución poblacional
c Garantiza que σ_X̄ = σ

🏆

Diapositiva 13 · Actividad evaluable

Actividad: distribuciones muestrales aplicadas

🎯 Contexto clínico

Se sabe que la glucosa en ayuno en adultos sanos sigue una distribución con μ = 90 mg/dL y σ = 8 mg/dL. Además, el 12% de la población presenta prediabetes (glucosa ≥ 100 mg/dL). Tiempo: 30 min.

1️⃣

Distribución de X̄ (n = 64)

Calcula μ_X̄ y σ_X̄ para una muestra de n = 64 pacientes. ¿Se puede aplicar el TCL? Justifica. Calcula P(X̄ > 91.5).

2️⃣

Comparación de n

Repite el cálculo de P(X̄ > 91.5) para n = 16 y n = 256. ¿Qué observas al aumentar n? ¿Por qué la probabilidad cambia?

3️⃣

Distribución de P̂ (prediabetes)

Para una muestra de n = 200 pacientes con p = 0.12: calcula μ_P̂ y σ_P̂, verifica la condición de normalidad, y calcula P(P̂ > 0.15).

4️⃣

Interpretación clínica

Si en una muestra de 200 pacientes encuentras p̂ = 0.18 (18% con prediabetes), ¿qué tan probable era obtener ese resultado o más extremo si la tasa real es 12%? ¿Qué conclusión sacarías?

Entregable

Resolución paso a paso: fórmulas, cálculos, valores Z, probabilidades e interpretación clínica de cada resultado.

Criterios

Uso correcto de fórmulas · Verificación de condiciones · Estandarización correcta · Interpretación en contexto biomédico

统计

✅ Clase completada

Ideas clave — Distribuciones Muestrales

5.1 — X̄ como V.A.

X̄ tiene distribución de prob., media μ_X̄ = μ y desviación σ_X̄ = σ/√n. Es estimador insesgado de μ.

Teorema Central

Para n ≥ 30, X̄ ≈ Normal(μ, σ/√n). Si la población es normal, aplica para cualquier n. Mayor n → distribución más estrecha y centrada.

Estandarización

Z = (X̄ − μ) / (σ/√n). Siempre usar σ_X̄, nunca σ directamente. Luego consultar tabla Z.

5.3 — P̂ como V.A.

μ_P̂ = p · σ_P̂ = √(pq/n). P̂ = X̄ para variables 0/1, por eso el TCL aplica.

Cond. normalidad P̂

Verificar que [p − 3σ_P̂, p + 3σ_P̂] ⊂ [0,1]. Más exigente que solo n ≥ 30 cuando p está cerca de 0 o 1.

BIBLIOGRAFÍA

Shafer, G. & Zhang, Z. (2012). Introductory Statistics. Saylor Academy. Chapter 6: Sampling Distributions. Disponible en: saylordotorg.github.io/text_introductory-statistics